語音交互服務(wù) SIS
語音交互服務(wù) SIS
語音交互服務(wù)(Speech Interaction Service,簡(jiǎn)稱(chēng)SIS)是一種智能人機(jī)互動(dòng)方式,用戶(hù)通過(guò)實(shí)時(shí)訪(fǎng)問(wèn)和調(diào)用API獲取語音交互結(jié)果。 適用場(chǎng)景如語音客服質(zhì)檢、會(huì)議記錄、語音短消息、有聲讀物、電話(huà)回訪(fǎng)等。
語音交互服務(wù)(Speech Interaction Service,簡(jiǎn)稱(chēng)SIS)是一種智能人機(jī)互動(dòng)方式,用戶(hù)通過(guò)實(shí)時(shí)訪(fǎng)問(wèn)和調(diào)用API獲取語音交互結(jié)果。 適用場(chǎng)景如語音客服質(zhì)檢、會(huì)議記錄、語音短消息、有聲讀物、電話(huà)回訪(fǎng)等。
產(chǎn)品列表
產(chǎn)品列表
時(shí)語音識別.jpg)
實(shí)時(shí)語音識別 RASR
實(shí)時(shí)語音識別(Real-time ASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換(huàn)成文本,語音識別更快。可應(yīng)用於直播實(shí)時(shí)字幕、會(huì)議實(shí)時(shí)記錄、即時(shí)文本生成等場(chǎng)景。
識別.jpg)
一句話(huà)識別 SASR
一句話(huà)識別將口述音頻轉(zhuǎn)換(huàn)為文本,通過(guò)API調(diào)用識別不超過(guò)一分鐘的不同音頻源發(fā)來(lái)的音頻流或音頻文件。適用於語音搜索、人機(jī)互動(dòng)等語音交互識別場(chǎng)景。

語音合成 TTS
語音合成服務(wù)提供在線(xiàn)語音合成能力,支持將文本信息實(shí)時(shí)轉(zhuǎn)化為近似的真人發(fā)聲,支持多語言多音色語音在線(xiàn)合成。支持客戶(hù)的個(gè)性化語音定製化需求。

錄音文件識別 LASR
錄音文件識別,基於深度學(xué)習(xí)技術(shù),可以實(shí)現(xiàn)5小時(shí)以內(nèi)的音頻到文字的轉(zhuǎn)換(huàn)。支持垂直領(lǐng)域定製,對(duì)應(yīng)領(lǐng)域轉(zhuǎn)換(huàn)效果更佳。

時(shí)語音合成.jpg)